iT邦幫忙

2025 iThome 鐵人賽

DAY 10
1
AI & Data

從網路爬蟲到資料洞察的應用系列 第 10

計算基本統計

  • 分享至 

  • xImage
  •  

昨天我們處理了數字欄位,把「帶逗號的字串數字」轉換成可以運算的數值型態。今天,我們要來計算股票數據的基本統計值,這些統計結果能幫助我們快速掌握整體走勢。

為什麼要計算統計值?

在股市分析中,單純看一堆每天的股價數字,往往很難快速得出結論。所以我們通常會先整理出一些關鍵指標,例如:

  • 平均收盤價:代表近期整體股價的水準。
  • 最高價:這段期間內的最高收盤價。
  • 最低價:這段期間內的最低收盤價。
  • 成交量總和:用來判斷市場在這段時間的交易熱絡程度。

這些統計值相當於「總覽」,能讓我們快速知道該股票在一段時間內的整體表現。

程式範例

我們假設已經有一份股價資料 DataFrame,接著使用 Pandas 的函式計算統計數據:

import pandas as pd

# 假設 df 已經包含股票資料
# df 裡有 'Close' (收盤價) 和 'Volume' (成交量) 欄位

df_stats = pd.DataFrame({
    'Average Price': [df['Close'].mean()],   # 平均收盤價
    'Highest Price': [df['Close'].max()],    # 最高收盤價
    'Lowest Price': [df['Close'].min()],     # 最低收盤價
    'Total Volume': [df['Volume'].sum()]     # 成交量總和
})

print("\n--- 基本統計 ---")
print(df_stats)

這段程式碼做了幾件事:

  • df['Close'].mean() → 計算收盤價平均數。
  • df['Close'].max() → 找出最高收盤價。
  • df['Close'].min() → 找出最低收盤價。
  • df['Volume'].sum() → 將成交量全部加總。

最後用一個新的 DataFrame (df_stats) 來集中展示這些統計數據。

輸出範例

假設我們有一段時間的資料,結果可能會長這樣:

--- 基本統計 ---
   Average Price  Highest Price  Lowest Price  Total Volume
0        1275.6           1300          1250     235000000

這樣就能清楚看到整體的統計結果,比單看一堆零散的數字還要有意義。

總結

  • 統計值能幫助快速理解股票的整體走勢。
  • 使用 Pandas 的 mean()、max()、min()、sum(),就能計算常見的指標。
  • 遇到「字串數字」要先轉換成數值型態,否則無法正確運算。

有了這些統計基礎,我們就能進一步做可視化圖表或趨勢分析,讓資料更直觀。
那今天就先這樣。
/images/emoticon/emoticon29.gif


上一篇
處理缺失值
下一篇
畫收盤價趨勢圖(matplotlib 折線圖)
系列文
從網路爬蟲到資料洞察的應用11
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言